#pragma once
//目录流
#include <stdio.h>
#include <dirent.h>
#include <sys/stat.h>

#include<iostream>
#include<vector>
#include<string>
#include<set>
#include<map>
#include<fstream>
#include<sstream>
#include<cctype>
using std::vector;
using std::string;
using std::map;
using std::set;
using std::pair;
class DictProducer
{
public:
    //构造函数需要一个切割工具类，暂时未实现
    DictProducer(string);//TODO:DicProducer(String,tool)
    //建立英文词典
    void buildEnDict();
    //建立中文词典
    void buildCnDIct();
    //建立索引
    void createIndex();
    //
    void store();
    //清洗
    void cleanEnContent(string &);
    void cleanCnContent(string &);
    //打印dict
    void printDict();
    //检查字节数
    size_t nByetesCode(const char ch);

private:
    //将文件读入到该容器中
    vector<string> _files;
    //词典的最终形态
    vector<pair<string,int>> _dict;
    //string 放的是字母或汉字
    map<string,set<int>> _index;


};

